我们通过靶向位置突出的精英(PSO-TPME)大大提高了粒子群优化(PSO)的收敛速度和全局勘探能力。这三个关键创新介绍了认知和社会模型中的粒子分类,精英和突变。PSO-TPME针对五个流行的PSO变体进行了基准测试,用于多维函数,这些函数在优化领域中广泛采用,特别是收敛的准确性,收敛速度和发现全局最小值的能力。统计误差通过许多重复评估。该模拟表明,提出的PSO变体在收敛速率和精度按数量级优于其他变体。
translated by 谷歌翻译
Magnetic Resonance Fingerprinting (MRF) is an efficient quantitative MRI technique that can extract important tissue and system parameters such as T1, T2, B0, and B1 from a single scan. This property also makes it attractive for retrospectively synthesizing contrast-weighted images. In general, contrast-weighted images like T1-weighted, T2-weighted, etc., can be synthesized directly from parameter maps through spin-dynamics simulation (i.e., Bloch or Extended Phase Graph models). However, these approaches often exhibit artifacts due to imperfections in the mapping, the sequence modeling, and the data acquisition. Here we propose a supervised learning-based method that directly synthesizes contrast-weighted images from the MRF data without going through the quantitative mapping and spin-dynamics simulation. To implement our direct contrast synthesis (DCS) method, we deploy a conditional Generative Adversarial Network (GAN) framework and propose a multi-branch U-Net as the generator. The input MRF data are used to directly synthesize T1-weighted, T2-weighted, and fluid-attenuated inversion recovery (FLAIR) images through supervised training on paired MRF and target spin echo-based contrast-weighted scans. In-vivo experiments demonstrate excellent image quality compared to simulation-based contrast synthesis and previous DCS methods, both visually as well as by quantitative metrics. We also demonstrate cases where our trained model is able to mitigate in-flow and spiral off-resonance artifacts that are typically seen in MRF reconstructions and thus more faithfully represent conventional spin echo-based contrast-weighted images.
translated by 谷歌翻译
小组同步问题涉及从其成对比率噪声测量中估算组元素的收集。此任务是许多计算问题中的关键组成部分,包括单粒子冷冻电子显微镜(Cryo-EM)中的分子重建问题。估计组元素的标准方法基于迭代应用线性和非线性操作员。受到与深神经网络的结构相似性的激励,我们采用了算法展开的概念,其中训练数据用于优化算法。我们为多种组同步实例设计了展开的算法,包括3-D旋转组的同步:Cryo-EM中的同步问题。我们还将类似的方法应用于多参考对准问题。我们通过数值实验表明,展开策略在各种情况下都优于现有的同步算法。
translated by 谷歌翻译
对比性自我监督学习方法学会将图像(例如图像)映射到无需标签的情况下将图像映射到非参数表示空间中。尽管非常成功,但当前方法在训练阶段需要大量数据。在目标训练集规模限制的情况下,已知概括是差的。在大型源数据集和目标样本上进行微调进行预处理,容易在几杆方向上过度拟合,在几个弹药方面,只有少量的目标样本可用。在此激励的情况下,我们提出了一种用于自我监督的对比度学习的域适应方法,称为少数最大的学习方法,以解决对目标分布的适应问题,这些问题在几乎没有射击学习下。为了量化表示质量,我们在包括ImageNet,Visda和FastMRI在内的一系列源和目标数据集上评估了很少的最大最大速度,在这些数据集和FastMRI上,很少有最大最大的最大值始终优于其他方法。
translated by 谷歌翻译
当代预测模型很难解释,因为他们的深网利用了输入要素之间的许多复杂关系。这项工作通过测量相关特征对网络相对于输入的功能熵的贡献,提出了模型可解释性的理论框架。我们依赖于对数 - 索波列夫的不等式,该不平等是通过功能性渔民信息与数据的协方差界定功能熵的。这提供了一种衡量特征子集对决策功能的信息贡献的原则方法。通过广泛的实验,我们表明我们的方法超过了基于图像,文本和音频等各种数据信号的现有基于基于可解释性抽样的方法。
translated by 谷歌翻译
将机器学习模型整合在医学中的关键问题是解释其推理的能力。流行的解释性方法表明了自然图像识别的令人满意的结果,但是在医学图像分析中,其中许多方法提供了部分和嘈杂的解释。最近,注意机制在预测性能和可解释的质量方面都表现出了令人信服的结果。关注的基本特征是,它利用输入的显着部分,这有助于模型的预测。为此,我们的工作着重于注意力分布的解释价值。我们提出了一种多层注意机制,该机制可以使用凸优化在卷积层之间实施一致的解释。我们应用二元性来分解层之间的一致性约束,通过重新聚集其注意力概率分布。我们进一步建议通过优化我们的目标来学习双重见证。因此,我们的实施使用标准的背部传播,因此非常有效。在保留预测性能的同时,我们提出的方法利用了弱注释的医学成像数据,并为模型的预测提供了完整而忠实的解释。
translated by 谷歌翻译
Channel estimation is a critical task in multiple-input multiple-output (MIMO) digital communications that substantially effects end-to-end system performance. In this work, we introduce a novel approach for channel estimation using deep score-based generative models. A model is trained to estimate the gradient of the logarithm of a distribution and is used to iteratively refine estimates given measurements of a signal. We introduce a framework for training score-based generative models for wireless MIMO channels and performing channel estimation based on posterior sampling at test time. We derive theoretical robustness guarantees for channel estimation with posterior sampling in single-input single-output scenarios, and experimentally verify performance in the MIMO setting. Our results in simulated channels show competitive in-distribution performance, and robust out-of-distribution performance, with gains of up to $5$ dB in end-to-end coded communication performance compared to supervised deep learning methods. Simulations on the number of pilots show that high fidelity channel estimation with $25$% pilot density is possible for MIMO channel sizes of up to $64 \times 256$. Complexity analysis reveals that model size can efficiently trade performance for estimation latency, and that the proposed approach is competitive with compressed sensing in terms of floating-point operation (FLOP) count.
translated by 谷歌翻译
本文研究了以$ \ mathbb {r}^d $使用球形协方差矩阵$ \ sigma^2 \ sigma^2 \ mathbf {i} $的$ k $学习中心的样本复杂性。特别是,我们对以下问题感兴趣:最大噪声水平$ \ sigma^2 $是什么,对此样品复杂性基本与从标记的测量值估算中心时相同?为此,我们将注意力限制为问题的贝叶斯公式,其中中心均匀分布在球体上$ \ sqrt {d} \ Mathcal {s}^{d-1} $。我们的主要结果表征了确切的噪声阈值$ \ sigma^2 $,而GMM学习问题(在大系统中限制$ d,k \ to \ infty $)就像从标记的观测值中学习一样容易更加困难。阈值发生在$ \ frac {\ log k} {d} = \ frac12 \ log \ left(1+ \ frac {1} {1} {\ sigma^2} \ right)$,这是添加性白色高斯的能力噪声(AWGN)频道。将$ K $中心的集合作为代码,可以将此噪声阈值解释为最大的噪声水平,AWGN通道上代码的错误概率很小。关于GMM学习问题的先前工作已将中心之间的最小距离确定为确定学习相应GMM的统计难度的关键参数。虽然我们的结果仅是针对中心均匀分布在球体上的GMM的,但他们暗示,也许这是与中心星座相关的解码错误概率作为频道代码确定学习相应GMM的统计难度,而不是仅仅最小距离。
translated by 谷歌翻译
深度神经网络的成功严重依赖于他们在其投入和其产出之间编码复杂关系的能力。虽然此属性适用于培训数据,但它也掩盖了驱动预测的机制。本研究旨在通过采用基于离散变分的自动化器来改变预测类的干预机制来揭示隐藏的概念。然后,解释模型从任何隐藏层和相应的介入表示可视化编码信息。通过评估原始代表与介入代表之间的差异,可以确定可以改变该类的概念,从而提供可解释性。我们展示了我们在Celeba上的方法的有效性,在那里我们对数据中的偏见显示了各种可视化,并建议揭示和改变偏见的不同干预措施。
translated by 谷歌翻译
信道估计是数字通信中的一个关键任务,极大地影响了端到端系统性能。在这项工作中,我们使用深扩散模型介绍了一种用于多输入多输出(MIMO)信道估计的新方法。我们的方法使用深神经网络,该虚拟神经网络训练,以估计无线信道的任何点在高维空间中的无线信道的阶梯的梯度,并利用该模型通过后部采样解决信道估计。我们训练来自CDL-D模型的频道实现深度扩散模型,用于两个天线间距,表明,与生成的对抗网络(GaN)和压缩感测相比,​​该方法会导致竞争性和分发性能竞争和分发性能(CS ) 方法。当在训练期间从未见过的CDL-C信道测试或微调,我们的方法与CS方法和仅$ 0.5 $ DB的CS方法和损失相比,我们的方法导致最高$ 3 $ DB的最高元编码性能。理想的渠道知识。为了鼓励开放和可重复的研究,我们的源代码可以在https://github.com/utcsilab/diffusion-channels获得。
translated by 谷歌翻译